Una componente importante en el almacén de
datos es el
Diccionario de Datos (Meta-Data), en el mismo se describen
los datos almacenados con el objetivo de
facilitar el acceso a los mismos a través de las herramientas
de explotación del almacén de datos. El Diccionario de
Datos establece correspondencias entre los datos almacenados
y los conceptos que estos representan para facilitar la
extracción de información por parte del usuario
final.
Interfaces
orientadas a usuarios que extraen información para la toma
de decisiones
Interfaces para consultas y reportes complejos:
Permiten al usuario construir gráficas y reportes a
partir de la información contenida en el
almacén de datos y descrita a través del
Diccionario de Datos. Algunas funcionalidades típicas
de estas herramientas son: agrupamiento y desagrupamiento
dinámico de datos en reportes, cambios en el orden de
los campos del reporte, visualización del resultado de
las consultas en forma gráfica (barras, torta, puntos,
etc.). Estas herramientas generan las expresiones en el
lenguaje de consulta que recupera los datos pedidos
(típicamente SQL), se conectan al almacén de
datos, recuperan el resultado y lo formatean según la
especificación dada.
Productos de análisis de datos (OLAPs):
Permiten representar los datos del problema en
términos de dimensiones. Por ejemplo, si se
trata de ventas de productos en diferentes zonas, una
dimensión del problema son las zonas, otra los
productos y otra el tiempo. De esta manera, las consultas de
análisis de datos de una dimensión en
función de la otra se realizan en forma inmediata.
Herramientas de Minería de Datos: Permiten
explorar el almacén de datos en búsqueda de
relaciones desconocidas o inesperadas entre los datos.
Las principales motivaciones para construir un almacén
de datos son las siguientes (Casares, 2003):
Disponer de Sistemas de Información de apoyo a la
decisión.Disponer de bases de datos que permitan extraer
conocimiento de la información histórica
almacenada en la organización.Diseñar una base de datos que permita ejecutar
consultas desconocidas.
Microsoft SQL
Server 2008
Microsoft SQL Server
2008 brinda una plataforma para la construcción y el mantenimiento
de almacenes de
datos, a continuación se muestran algunas de sus
nuevas características y mejores prácticas
asociadas a las mismas:
Compresión de Datos
La compresión de datos reduce el espacio requerido para
almacenar tablas e índices permitiendo un uso más
eficiente de la capacidad de almacenamiento.
Existe la posibilidad de la compresión por artículo
o por página. La compresión por artículo
almacena todos los campos en un formato de ancho variable, la
compresión por página hace lo mismo pero se realiza
entre los artículos de una misma página. Un
diccionario a
nivel de página es usado para almacenar los valores
comunes, además prefijos comunes de valores de
columnas son almacenados solo una vez en la página. Ambas
formas de compresión pueden ser aplicadas a las tablas y a
los índices.
Encriptación de Datos Transparente
La encriptación de datos transparente permite que los
datos sean almacenados de forma segura mediante la
encriptación de los ficheros de la base de datos.
El SQL Server
realiza la encriptación y desencriptación
directamente por lo que el proceso es
transparente para la aplicación conectada. Si se utiliza a
la vez compresión de datos y encriptación, se deben
realizar las operaciones en
este orden.
Gobernador de Recursos
El Gobernador de Recursos les
permite a los administradores el control y la
asignación de recursos como Procesadores y
Memoria a las
aplicaciones de más alta prioridad.
Adición en Caliente de Procesadores y
Memoria
La edición
de SQL Server Enterprise de 64 bits permite la adición en
caliente de procesadores y memoria sin necesidad de apagar el
servidor ni
limitar las conexiones existentes.
Operador MERGE
El nuevo operador MERGE simplifica el proceso de carga de un
almacén de datos desde su fuente. Este nuevo operador
distingue los artículos nuevos y actualizados en la base
de datos fuente y realiza la acción
apropiada en el almacén de datos.
Nuevos Tipos de Datos Espaciales
Los nuevos tipos de datos
espaciales GEOGRAPHY y GEOMETRY permite que datos espaciales
puedan almacenarse directamente en SQL Server 2008. GEOGRAPHY
permite representar datos geodésicos en tres dimensiones
los cuales son utilizados por aplicaciones GPS y GEOMETRY
permite representar puntos en planos de dos dimensiones.
Además existe una integración con Virtual Earth lo cual
permite representaciones gráficas de localizaciones
físicas.
Todas estas nuevas características hacen de Microsoft SQL
Server 2008 una herramienta de avanzada para la creación y
el mantenimiento de almacenes de
datos.
Bibliografía
, C.
(2003) Data Warehousing.
INMON, B. (2007) Coporate Information Factory. Inmon
Consulting Services.
MICROSOFT (2008) Best Practices for Data Warehousing with SQL
Server 2008.
MICROSOFT (2008) What's New in SQL Server 2008.
Autor:
Lic. Carlos Galindo González
Dr. Ramiro Pérez Vázquez
Universidad Central de Las Villa, Cuba
Página anterior | Volver al principio del trabajo | Página siguiente |